期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于云计算和改进 K-means算法的海量用电数据分析方法
张承畅, 张华誉, 罗建昌, 何丰
计算机应用    2018, 38 (1): 159-164.   DOI: 10.11772/j.issn.1001-9081.2017071660
摘要398)      PDF (943KB)(445)    收藏
针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进 K-means算法的海量用电数据分析方法研究。针对传统 K-means算法中存在初始聚类中心和 K值难确定的问题,提出一种基于密度的 K-means改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进 K-means算法运行稳定、可靠,具有很好的聚类效果。
参考文献 | 相关文章 | 多维度评价